フィールドとチャートのタイプ〜Tableauで散布図を作成する #tableau
はじめに
こんにちは。DI部のtamaです。
本エントリは、Tableau Desktop Qualified Associateの試験ガイド「評価するスキル」に関連する内容となります。
本エントリの概要
今回は散布図の作成方法と、その使用場面について、見ていきたいと思います。
散布図とは
散布図については、それこそネットを検索すれば、解説がゴロゴロ出てくるくらい、分析界隈ではメジャーな存在です。
2つのデータを縦軸と横軸にとり、それぞれの値を点にしてプロットしたグラフとなります。
Tableauにおける散布図の作成方法
Tableauには、散布図を簡単に作成できる機能がついているため、容易に作成することができます。
右上の「表示形式」というところに、散布図の項目があります。これを選択すれば、Vizを散布図の原型にしてくれます。
散布図の項目を選択するために、必要な条件は以下の通りです。
- 「メジャー」が2個〜4個、行列に設置されていること
- 「ディメンション」は0個以上(要するにあっても無くてもよい)
作業環境
- MacOS High Sierra 10.13.1
- Tableau 10.4.1
使用データ
- Tableau付属のサンプルスーパーストア
作成方法
何の面白みも無くて恐縮ではありますが、今回は「売上と利益の相関を散布図で可視化」しようと思います。(単純でわかりやすいのと、他に良いデータがない…)
というわけで、まずは「売上」と「利益」を配置します。 すると、この時点で自動的に「散布図」が選択されていますね。
しかし、この状態は、「売上(の合計)」と「利益(の合計)」というたった2つのデータがプロットされているだけです。 データの最小単位でプロットされないと、散布図が描けません。ですので、何らかのディメンションを追加して、そのディメンション毎に点を散らばせましょう。
ここでは「メーカー」をマークシェルフの「ラベル」に持ってきます。 すると、売上と利益がメーカー毎の合計になりました。
売上が上がるほど(図の右にいくほど)、利益も高い傾向にありそう…と、何となくは思いますが、実際のところはどうなのでしょうか? Tableauには「傾向線」という機能があり、これを引くことで相関係数を算出することが出来ます。
左上のメニューから「アナリティクス」タブを選択し、その中にある「傾向線」を散布図にドラッグします。
すると、傾向線が引かれます。傾向線にカーソルを合わせると、相関に関する統計値も表示されます。
統計学の説明を、本エントリ内で深く説明はしませんが、このデータの売上と利益には相関関係が見えますね。
散布図の使用場面
とにかく「あるデータ」と「あるデータ」の関係を探りたい場合は、散布図の出番だといえます。
- 「会員数」×「売上」
- たくさん登録させられれば、売上も上がるのか?…とか
- 「クリック数」×「CV数」
- たくさんクリックさせられれば、コンバージョンも増えるのか?…とか
おわりに
Tableauにおける散布図の作成を見てきました。 今回はいつものTableau付属データでやりましたが、ぜひ他のデータでチャンレジして見てください。